package moduloIndexacion.analizador;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.InputStream;

import org.apache.poi.hwpf.extractor.WordExtractor;

import entidades.Extension;

public class AnalizadorWord_Doc extends TemplateAnalizador{
	
	public AnalizadorWord_Doc(){
		super.extension = new Extension ("doc","Microsoft Word Versiones Pre 2007");
	}
	
	@Override
	protected String obtenerTexto() {
		String rutaAcceso = documento.getUbicacion()+documento.getNombre();
		String textoWord;
		try{
			FileInputStream fis;
			fis = new FileInputStream(rutaAcceso);
			InputStream entradaArch = fis;
			//el archivo esta en el stream entradaArch 

			WordExtractor we;
			we = new WordExtractor(entradaArch);
			textoWord = we.getText();
			}
			catch (FileNotFoundException e) {
				System.out.println("ERROR: "+e.toString());
				return null;
			}catch (IllegalArgumentException e){
				System.out.println("ERROR: "+ e.toString());
				return null;
			}catch (Exception e) {
				System.out.println("ERROR: "+e.toString());
				return null;
			} 
		return textoWord;
	}
}